Projekt z Analizy Danych - SiƂownia

Aleksandra OchociƄska

Mateusz Wasiewski

Adam Sienkiewicz

Wprowadzenie

1. Wstęp

2. Zmienne w zbiorze danych

‱ Age - wiek uĆŒytkownika siƂowni.

‱ Gender - pƂeć uĆŒytkownika siƂowni.

‱ Weight (kg)- waga uĆŒytkownika siƂowni w kilogramach.

‱ Height (m) - wzrost uĆŒytkownika siƂowni w metrach

‱ Max_BPM - maksymalne tętno podczas sesji treningowych.

‱ Avg_BPM - ƛrednie tętno podczas sesji treningowych.

‱ Resting_BPM - spoczynkowe tętno przed treningiem.

‱ Session_Duration - czas trwania kaĆŒdej sesji treningowej w godzinach.

‱ Calories_Burned - caƂkowita liczba kalorii spalonych podczas kaĆŒdej sesji.

‱ Workout_Type - rodzaj wykonanego treningu (np. kardio, siƂowy, joga, HIIT).

‱ Fat_Percentage -procent tkanki tƂuszczowej.

‱ Water_Intake - spoĆŒycie wody podczas treningu w litrach.

‱ Workout_Frequency - liczba sesji treningowych w tygodniu.

‱ Experience_Level - poziom doƛwiadczenia, od początkującego (1) do eksperta (3).

‱ BMI - wskaĆșnik masy ciaƂa, obliczany na podstawie wzrostu i wagi.

3. Struktura danych

Nazwa zbioru danych silownia
Liczba wierszy 973
Liczba kolumn 15
Kolumny typu tekstowego 2
Kolumny typu liczbowego 13

Kolumny typu tekstowego

Kolumna Brakujące wartoƛci Kompletnoƛć Min Max Puste Unikalne wartoƛci Whitespace
PƂeć 0 1.00 4 6 0 2 0
Typ treningu 150 0.85 4 8 0 4 0

Kolumny typu liczbowego

Kolumna Brakujące wartoƛci Kompletnoƛć ƚrednia Odchylenie standardowe 0 Percentyl 25 Percentyl 50 Percentyl 75 Percentyl 100 Percentyl Histogram
Wiek 100 0.90 38.63 12.27 18.00 28.00 39.00 50.00 59.00 ▇▆▆▇▇
Waga 0 1.00 73.85 21.21 40.00 58.10 70.00 86.00 129.90 ▅▇▅▂▂
Wzrost 0 1.00 1.72 0.13 1.50 1.62 1.71 1.80 2.00 ▅▇▇▃▃
Maksymalne tętno 0 1.00 179.88 11.53 160.00 170.00 180.00 190.00 199.00 ▇▇▇▇▇
ƚrednie tętno 0 1.00 143.77 14.35 120.00 131.00 143.00 156.00 169.00 ▇▇▆▆▆
Spoczynkowe tętno 0 1.00 62.22 7.33 50.00 56.00 62.00 68.00 74.00 ▇▆▇▇▇
Czas trwania sesji 0 1.00 1.26 0.34 0.50 1.04 1.26 1.46 2.00 ▂▅▇▃▂
Spalone kalorie 0 1.00 905.42 272.64 303.00 720.00 893.00 1076.00 1783.00 ▃▇▇▂▁
Procent tkanki tƂuszczowej 0 1.00 24.98 6.26 10.00 21.30 26.20 29.30 35.00 ▂▂▅▇▅
SpoĆŒycie wody 0 1.00 2.63 0.60 1.50 2.20 2.60 3.10 3.70 ▃▆▇▃▆
Częstotliwoƛć treningów 0 1.00 3.32 0.91 2.00 3.00 3.00 4.00 5.00 ▅▇▁▆▂
Poziom doƛwiadczenia 0 1.00 1.81 0.74 1.00 1.00 2.00 2.00 3.00 ▇▁▇▁▃
BMI 150 0.85 24.82 6.60 12.32 20.10 23.94 28.45 47.72 ▃▇▅▁▁

4. Wstępne przygotowanie danych

Przed rozpocząciem procesu Data Wranglingu pobraliƛmy i zainstalowaliƛmy wszystkie niezbędne pakiety potrzebne do naszej analizy. Kolejnym krokiem byƂa zmiana nazw kolumn z :

  • Weight (kg) na Weight_kg

  • Height (m) na Height_m

  • Session_Duration (hours) na Session_Duration_hours

  • Water_Intake (liters) na Water_Intake_liters

  • Workout_Frequency (days/week) na Workout_Frequency_daysweek

Data Wrangling

1. Obserwacje odstające

Obserwacje odstające to dane, ktĂłre znacząco rĂłĆŒnią się od reszty zbioru, co moĆŒe wynikać z bƂędĂłw pomiaru, specyfiki badanego zjawiska lub innych nietypowych czynnikĂłw. W celu poznania obserwacji odstających w naszym zbiorze danych zastowaliƛmy wykres ramkowy (box plot), pozwalający na wizualne wykrycie wartoƛci wykraczających poza typowy zakres danych.

Wiek

Zmienna Wiek nie posiada obserwacji odstających.

Waga

Zmienna Waga posiada odstające obserwacje (gĂłrne outliery), czyli obserwacje, ktĂłre znajdują się o więcej niĆŒ 1,5 rozstępu ćwiartkowego powyĆŒej trzeciego kwartyla.

Wzrost

Zmienna Wzrost nie ma obserwacji odstających.

Maksymalne tętno

Zmienna Maksymalne tętno nie posiada obserwacji odstających.

ƚrednie tętno

Zmienna ƚrednie tętno nie ma obserwacji odstających.

Tętno spoczynkowe

Zmienna Tętno spoczynkowe nie ma obserwacji odstających.

Czas trwania sesji

Zmienna Czas trwania sesji nie posiada obserwacji odstających.

Spalone kalorie

Zmienna Spalone kalorie posiada gĂłrne outliery, czyli obserwacje, ktĂłre znajdują się o więcej niĆŒ 1,5 rozstępu ćwiartkowego powyĆŒej trzeciego kwartyla.

Procent tkanki tƂuszczowej

Zmienna Procent tkanki tƂuszczowej nie ma obserwacji odstających.

Iloƛć wypitej wody

Zmienna Iloƛć wypitej wody nie posiada obserwacji odstających.

Częstotliwoƛć treningów

Zmienna Częstotliwoƛć treningów nie posiada obserwacji odstających.

BMI

W przypadku zmiennej BMI występują gĂłrne outliery, czyli obserwacje, ktĂłre znajdują się o więcej niĆŒ 1,5 rozstępu ćwiartkowego powyĆŒej trzeciego kwartyla.

Podsumowanie

Za pomocą wykresu ramkowego wykazano, ĆŒe w przypadku zmiennych Waga, Spalone kalorie oraz BMI występują gĂłrne outliery,czyli obserwacje, ktĂłre znajdują się o więcej niĆŒ 1,5 rozstępu ćwiartkowego powyĆŒej trzeciego kwartyla. Ć»adna zmienna natomiast nie posiada ekstremalnych obserwacji odstających.

2. Analiza brakĂłw danych

Analiza brakĂłw danych jest kluczowym etapem przygotowania zbioru danych do dalszej analizy. W ramach tego procesu okreƛlimy liczbę brakĂłw w zbiorze, przeanalizujemy ich rozmieszczenie oraz sprawdzimy, czy występują korelacje między brakami w rĂłĆŒnych zmiennych. Wyniki tej analizy posƂuĆŒÄ… jako podstawa do podjęcia decyzji o dalszym postępowaniu z brakującymi danymi.

Wstępna analiza braków danych

Sprawdzenie gdzie występują braki danych i procentowo ile ich jest

W caƂej bazie danych brakuje 2,7% danych.

Braki danych występują w kolumnie Typ treningu, Wiek oraz BMI.

Ile brakĂłw jest w poszczegĂłlnych kolumnach

Kolumna Wiek ma 100 brakĂłw.

Kolumna Typ treningu ma 150 brakĂłw.

Kolumna BMI ma 150 brakĂłw.

Występowanie braków w wierszach

Liczba NA w wierszu Liczba wierszy Procent wszystkich wierszy
0 631 64,85%
1 287 29,50%
2 52 5,34%
3 3 0,31%

631 wierszy ma 0 NA

287 wierszy ma 1 NA

  • 115 w Typ treningu

  • 106 w BMI

  • 66 w Wiek

52 wiersze ma 2 NA

  • 21 wierszy w Typ treningu i BMI

  • 20 wierszy w Wiek i BMI

  • 11 w Wiek i Typ treningu

3 wiersze mają 3 NA

Sprawdzanie korelacji między brakami danych

1. Wiek i BMI

Braki w kolumnie BMI są caƂkowicie niezaleĆŒne od wartoƛci w kolumnie Wiek.

Z kolei braki w kolumnie Wiek są raczej niezaleĆŒne od wartoƛci BMI, choć zauwaĆŒono nieco większą liczbę brakĂłw w przypadku niĆŒszych wartoƛci BMI.

2. Typ treningu i BMI

Braki w kolumnie BMI są caƂkowicie niezaleĆŒne od wartoƛci w kolumnie Typ treningu.

Z kolei braki w kolumnie Typ treningu są raczej niezaleĆŒne od wartoƛci BMI, choć zauwaĆŒono nieco większą liczbę brakĂłw w przypadku niĆŒszych wartoƛci BMI.

3. Typ treningu i Wiek

Braki w obu kolumnach są caƂkowicie niezaleĆŒne od siebie.

3. Imputacja brakĂłw danych

W procesie analizy braków danych napotkaliƛmy na brakujące wartoƛci (NA) w kolumnach Wiek, BMI oraz Typ treningu. Aby zapewnić spójnoƛć i peƂnoƛć danych, postanowiliƛmy przeprowadzić imputację braków, czyli zastąpienie brakujących wartoƛci odpowiednimi danymi.

Kolumna BMI

Braki w kolumnie postanowaliƛmy zastąpić za pomocą wzoru na BMI.

\[ BMI = \frac{waga}{wzrost^2} \]

silownia$BMI <- ifelse(
  is.na(silownia$BMI),  
  silownia$Weight_kg / (silownia$Height_m^2),  
  silownia$BMI )

Wybraliƛmy wzĂłr na BMI jako metodę uzupeƂniania brakĂłw, poniewaĆŒ opiera się on na dwĂłch kluczowych zmiennych: wadze i wzroƛcie, ktĂłre w naszym zbiorze danych są kompletne. Dzięki temu obliczenie BMI za pomocą wzrou jest najbardziej rzetelną metodą imputacji, gdyĆŒ wykorzystuje dostępne, peƂne informacje do oszacowania brakujących wartoƛci.

Kolumna Typ treningu i Wiek

W przypadku kolumny Typ treningu i Wiek zdecydowaliƛmy przeprowadzić imputację na kilka sposĂłb, a następnie wybrać najlepszą moĆŒliwoƛć.

1. Imputacja metodą k-Nearest Neighbors (kNN)

silownia_kNN <- kNN(silownia, k = 3)

2. Imputacja z pakietem Mice

if (!is.factor(silownia$Workout_Type)) {
  silownia$Workout_Type <- factor(silownia$Workout_Type, levels = c("Yoga", "Cardio", "HIIT", "Strength"))
}

metody <- make.method(silownia)

metody["Age"] <- "pmm"
metody["Workout_Type"] <- "polyreg"
metody["BMI"] <- "" 

pred_mat <- make.predictorMatrix(silownia)
pred_mat["BMI", ] <- 0 # WyƂącz imputację dla BMI
pred_mat[, "BMI"] <- 1 # BMI jako predyktor dla innych kolumn

silownia_imp <- mice(silownia, m = 5, method = metody, predictorMatrix = pred_mat, seed = 123)

lm_imp <- with(silownia_imp, lm(BMI ~ Weight_kg + Gender))
lm_pooled <- pool(lm_imp)

summary(lm_pooled, conf.int = TRUE, conf.level = 0.95)

stripplot(silownia_imp, BMI ~ Weight_kg | .imp, pch = 20, cex = 2)

silownia_mice <- complete(silownia_imp, action = 1)

3. Imputacja hot-deck

silownia_hotdeck <- hotdeck(silownia)

4. Imputacja RPART

silownia_rpart  <- silownia  %>%
  mutate(Workout_Type = case_when(
    Workout_Type == "Yoga" ~ 1,
    Workout_Type == "Cardio" ~ 2,
    Workout_Type == "HIIT" ~ 3,
    Workout_Type == "Strength" ~ 4,
    TRUE ~ as.numeric(Workout_Type) 
  ))

silownia_rpart <- silownia_rpart %>%
  mutate(Gender = case_when(
    Gender == "Male" ~ 1,
    Gender == "Female" ~ 2,
    TRUE ~ as.numeric(Gender) 
  ))


drzewo_decyzyjne1 <- rpart(Workout_Type ~ Age + BMI + Max_BPM + Weight_kg + Height_m + Avg_BPM + Resting_BPM + 
                             Session_Duration_hours + Calories_Burned + 
                             Fat_Percentage + Water_Intake_liters + 
                             Workout_Frequency_daysweek + Gender + Experience_Level, data = silownia_rpart, method = "anova", na.action = na.exclude)

silownia_rpart$Workout_Type[is.na(silownia_rpart$Workout_Type)] <- predict(drzewo_decyzyjne1, newdata = silownia_rpart[is.na(silownia_rpart$Workout_Type), ])


drzewo_decyzyjne2 <- rpart(Age ~ BMI + Workout_Type + Gender + Max_BPM + Weight_kg + Height_m + Avg_BPM + Resting_BPM + 
                             Session_Duration_hours + Calories_Burned + 
                             Fat_Percentage + Water_Intake_liters + 
                             Workout_Frequency_daysweek + Experience_Level, data = silownia_rpart, method = "anova", na.action = na.exclude)
silownia_rpart$Age[is.na(silownia_rpart$Age)] <- predict(drzewo_decyzyjne2, newdata = silownia_rpart[is.na(silownia_rpart$Age), ])

WybĂłr metody

Zdecydowaliƛmy się zastąpić braki danych występujące w kolumnach Wiek i Typ treningu za pomocą metody hot-deck, poniewaĆŒ jest to podejƛcie, ktĂłre pozwala na imputację brakujących wartoƛci w sposĂłb uwzględniający podobieƄstwo do istniejących danych. Dzięki tej metodzie wartoƛci brakujące są zastępowane rzeczywistymi danymi z innych obserwacji o podobnych cechach,

4. Walidacja danych

Po zakoƄczeniu procesu uzupeƂniania brakĂłw w naszych danych, kolejnym krokiem w przygotowywaniu ich do dalszej analizy jest ich walidacja. Ten etap pozwala sprawdzić czy dane, są wolne od bƂędĂłw, niespĂłjnoƛci i nieƛcisƂoƛci, ktĂłre mogƂyby negatywnie wpƂynąć na dalszą pracę z nimi. Walidacja danych obejmuje zarĂłwno sprawdzenie poprawnoƛci logicznej, strukturalnej, jak i identyfikację potencjalnych anomalii czy niezgodnoƛci z przyjętymi zaƂoĆŒeniami.

Wiek

Wartoƛci w kolumnie Wiek powinny być liczbami caƂkowitymi mieszczącymi się w przedziale od 0 do 110 wƂącznie.

PƂeć

Kolumna PƂeć przyjmuje wartoƛć Female albo Male.

Waga

Wartoƛci w kolumnie Waga powinny być liczbami mieszczącymi się w przedziale od 40 kg do 140 kg wƂącznie.

Wzrost

W kolumnie Wzrost powinny znajdować się wartoƛci liczbowe z zakresu od 1.30 m do 2.15 m wƂącznie.

Maksymalne tętno

Kolumna Maksymalne tętno musi posiadać wartoƛci, które są liczbami z zakresu od 110 do 210 wƂącznie.

ƚrednie tętno

Wartoƛci w kolumnie ƚrednie tętno powinny być liczbami mieszczącymi się w przedziale od 80 do 180 wƂącznie.

Spoczynkowe tętno

W kolumnie Spoczynkowe tętno powinny znajdować się wartoƛci liczbowe z zakresu od 45 do 130 wƂącznie.

Czas trwania sesji

Wartoƛci w kolumnie Czas trwania sesji powinny być dodatnimi liczbami nieprzekraczającymi 2.

Spalone kalorie

Wartoƛci powinny być dodatnimi liczbami nieprzekraczającymi 2000.

Typ treningu

Kolumna Typ treningu powinna zawierać tylko takie wartoƛci jak: Yoga, Cardio, HIIT oraz Strength.

Procent tkanki tƂuszczowej

Wartoƛci w kolumnie Procent tkanki tƂuszczowej powinny być liczbami dodatnimi nieprzekraczającymi 50.

Iloƛć wypitej wody

Wartoƛci powinny być liczbami dodatnimi nieprzekraczającymi 4.

Częstotliwoƛć treningów

Kolumna Czętotliwoƛć treningów powinna zawierać tylko takie wartoƛci jak: 0, 1, 2, 3, 4, 5, 6, 7.

Poziom doƛwiadczenia

Kolumna Poziom doƛwiadczenia powinna zawierać tylko takie wartoƛci jak: 0, 1, 2, 3.

BMI

Wartoƛci w kolumnie BMI powinny być dodatnimi liczbami mieszczącymi się w przedziale od 10 do 60 wƂącznie, a ich rĂłĆŒnica względem wartoƛci obliczonej jako Weight_kg/Height_m^2 powinna być mniejsza niĆŒ 0.1.”

Podsumowanie

W naszym zbiorze danych nie wystąpiƂy ĆŒadne bƂędy, więc jest on gotowy do przeprowadzenie wizualizacji oraz dalszej analizy.

Wizualizacja danych i analiza opisowa

RozkƂad pƂci

Wykres pokazuje rĂłwnomierny rozkƂad pƂci w analizowanym zbiorze danych. Widoczna jest zbliĆŒona liczba kobiet i mÄ™ĆŒczyzn, z niewielką przewagą mÄ™ĆŒczyzn, okoƂo 500 osĂłb w kaĆŒdej grupie.

RozkƂad wieku w zaleĆŒnoƛci od pƂci

Wykres przedstawia rozkƂad wieku w zaleĆŒnoƛci od podanej pƂci. ZauwaĆŒyć moĆŒna większy udziaƂ mÄ™ĆŒczyzn w grupie wiekowej 25-39 lat. Z kolei w grupie 40-55 lat przewaĆŒyƂa pƂeć ĆŒeƄska.

Statystyki opisowe zmiennej wiek w zaleĆŒnoƛci od pƂci

PƂeć
Statystyka Kobiety MÄ™ĆŒczyĆșni
Min 18 18
Max 59 59
Kwartyl dolny 27 28.5
Mediana 39 39
Kwartyl gĂłrny 50 49
Úrednia 38.34 38.76
Odch. std. 12.47 12.05
IQR 23 20.5
Odchylenie ćwiartkowe 11.5 10.25
Odch. std. w % 0.33 0.31
Odch. ćwiartkowe w % 0.59 0.53
Skoƛnoƛć -0.08 -0.05
Kurtoza -1.28 -1.19

ZaleĆŒnoƛć BMI od wieku

Wykres pokazuje, jakie wartoƛci wskaĆșnika BMI osiągano dla danego wieku. Dodano takĆŒe linię trendu, ktĂłra zostaƂa oszacowana na poziomie BMI = 25.

Statystyki opisowe zmiennej BMI w zaleĆŒnoƛci od wieku

Wiek
Statystyka 18-29 29-39 39-49 49-59
Min 12.73 12.67 12.32 12.47
Max 45.14 48.4301173601585 49.843756027931 47.72
Kwartyl dolny 20.335 20.649533029469 19.69 19.67
Mediana 24.68 24.11 23.16 24.31
Kwartyl gĂłrny 29.02 29.5951033057851 26.64 28.97
Úrednia 25.3 25.4 23.84 24.94
Odch. std. 6.51 6.79 6.41 6.79
IQR 8.69 8.95 6.95 9.3
Odchylenie ćwiartkowe 4.34 4.47 3.47 4.65
Odch. std. w % 0.13 0.11 0.11 0.11
Odch. ćwiartkowe w % 0.2 0.21 0.17 0.21
Skoƛnoƛć 0.62 0.84 1.06 0.63
Kurtoza 0.28 0.81 1.94 0.3

Na podstawie powyĆŒszych wynikĂłw moĆŒna stwierdzić, ĆŒe najwyĆŒszą ƛrednią wartoƛć BMI osiągnięto dla grupy wiekowej 18-29 lat, dla ktĂłrej największa jest teĆŒ mediana BMI rĂłwna 24,96. Minimalna wartoƛć BMI to 12,32 dla osĂłb w wieku 39-49 lat, a maksymalna wynosi niespeƂna 50 dla tej samej grupy wiekowej. W grupie wiekowej 49-59 nastąpiƂo największe rozproszenie danych. WyniosƂo ono 7,1. Rozstęp międzykwartylowy (IQR) osiąga wartoƛci od 7,08 do 9,08, co wskazuje na stabilnoƛć w centralnej częƛci rozkƂadu. RozkƂad BMI jest lekko dodatnio skoƛny. Wartoƛci Bmi większe od ƛredniej są nieco bardziej rozproszone. Wartoƛci kurtozy wskazują na to, ĆŒe dane są bardziej rozproszone, a wyniki nie wykazują silnej koncentracji wokóƂ ƛredniej ani wielu skrajnych wartoƛci.

RozkƂad wagi w zaleĆŒnoƛci od pƂci

RozkƂad wagi u kobiet jest bardziej skoncentrowany w przedziale 50–70 kg, co wskazuje na mniejszą zmiennoƛć i większą jednolitoƛć w populacji kobiet.

RozkƂad wagi u mÄ™ĆŒczyzn jest szerszy, co oznacza większą zmiennoƛć. Wagi mÄ™ĆŒczyzn najczęƛciej mieszczą się w przedziale 70–90 kg, ale rozkƂad ma dƂuĆŒszy ogon w kierunku wyĆŒszych wartoƛci, sięgając ponad 120 kg.

OgĂłlnie, mÄ™ĆŒczyĆșni wykazują większe zrĂłĆŒnicowanie wag w porĂłwnaniu do kobiet, z tendencją do wyĆŒszych wartoƛci wagi. RozkƂady są symetryczne, z wyraĆșnymi rĂłĆŒnicami między ƛrednimi i zakresami wag dla obu pƂci.

Statystyki opisowe zmiennej wagi w zaleĆŒnoƛci od pƂci

PƂeć
Statystyka Kobiety MÄ™ĆŒczyĆșni
Min 40 45
Max 79.9 129.9
Kwartyl dolny 54.05 69.75
Mediana 61.35 85.3
Kwartyl gĂłrny 69.175 101.6
Úrednia 60.94 85.53
Odch. std. 10.24 21.79
IQR 15.13 31.85
Odchylenie ćwiartkowe 7.56 15.92
Odch. std. w % 0.17 0.25
Odch. ćwiartkowe w % 0.25 0.37
Skoƛnoƛć -0.16 0.15
Kurtoza -0.81 -0.73

Waga kobiet waha się od 40 do 79,9 kg. Mediana wynosi 61,35 kg, a ƛrednia 60,94 kg, co wskazuje na zbliĆŒone wartoƛci centralne. Rozstęp międzykwartylowy (IQR) wynosi 15,13, a odchylenie standardowe 10,24, co wskazuje na umiarkowaną zmiennoƛć wagi w tej grupie. Skoƛnoƛć (-0,16) wskazuje na lekko ujemny rozkƂad, co oznacza, ĆŒe częƛciej występują wyĆŒsze wartoƛci wagi, a kurtoza (-0,81) sugeruje spƂaszczony rozkƂad.

Waga mÄ™ĆŒczyzn jest bardziej zrĂłĆŒnicowana i waha się od 45 do 129,9 kg. Mediana wynosi 85,3 kg, a ƛrednia 85,53 kg, co oznacza, ĆŒe większoƛć wartoƛci oscyluje wokóƂ tego przedziaƂu. Rozstęp międzykwartylowy (IQR) wynosi 31,85, a odchylenie standardowe 21,79, co wskazuje na większe zrĂłĆŒnicowanie wagi niĆŒ w przypadku kobiet. Skoƛnoƛć (0,15) sugeruje lekko dodatni rozkƂad, co oznacza, ĆŒe częƛciej występują niĆŒsze wartoƛci wagi, a kurtoza (-0,73) rĂłwnieĆŒ wskazuje na spƂaszczony rozkƂad.

Podsumowując, kobiety mają mniejsze zrĂłĆŒnicowanie wagi w porĂłwnaniu do mÄ™ĆŒczyzn, ktĂłrych wagi rozkƂadają się na szerszym przedziale. Mediana i ƛrednia wagi są wyĆŒsze u mÄ™ĆŒczyzn. RozkƂady w obu grupach są lekko spƂaszczone, ale rĂłĆŒnią się kierunkiem skoƛnoƛci.

Czas trwania sesji a spalone kalorie

Statystyki opisowe dla spalonych kalorii w zaleĆŒnoƛci od dƂugoƛci trwania sesji treningowej

Czas trwania sesji
Statystyka 0,5-1h 1-1,5h 1,5-2h
Min 303 576 837
Max 832 1385 1783
Kwartyl dolny 446 793 1134
Mediana 534.5 888 1240
Kwartyl gĂłrny 632 1005.5 1372.5
Úrednia 540.77 902.47 1258.46
Odch. std. 115.7 150.64 187.41
IQR 186 212.5 238.5
Odchylenie ćwiartkowe 93 106.25 119.25
Odch. std. w % 0.21 0.17 0.15
Odch. ćwiartkowe w % 0.35 0.24 0.19
Skoƛnoƛć 0.18 0.32 0.34
Kurtoza -0.77 -0.37 -0.14

0,5–1 godz.: Liczba spalonych kalorii waha się od 303 do 832, z medianą 534,5 i ƛrednią 540,77. Rozstęp międzykwartylowy (IQR) wynosi 186, co wskazuje na umiarkowaną zmiennoƛć w centralnej częƛci rozkƂadu. Odchylenie standardowe wynosi 115,7, co oznacza niewielkie zrĂłĆŒnicowanie wartoƛci. RozkƂad jest lekko dodatnio skoƛny (0,18), co oznacza, ĆŒe wartoƛci wyĆŒsze od ƛredniej pojawiają się rzadziej.

1–1,5 godz.: Liczba spalonych kalorii wzrasta, waha się od 576 do 1385, z medianą 888 i ƛrednią 902,47. Rozstęp międzykwartylowy (IQR) wynosi 212,5, co oznacza większą zmiennoƛć niĆŒ w poprzedniej kategorii. Odchylenie standardowe to 150,64, co wskazuje na większe zrĂłĆŒnicowanie wynikĂłw. Skoƛnoƛć (0,32) jest nieco wyĆŒsza, co wskazuje na większą asymetrię w kierunku wyĆŒszych wartoƛci.

1,5–2 godz.: Liczba spalonych kalorii jest najwyĆŒsza, od 837 do 1783, z medianą 1240 i ƛrednią 1258,46. Rozstęp międzykwartylowy (IQR) wynosi 238,5, a odchylenie standardowe 187,41, co wskazuje na największą zmiennoƛć w tej grupie. Skoƛnoƛć (0,34) jest podobna do poprzedniej grupy, sugerując asymetrię w kierunku wyĆŒszych wartoƛci.

Podsumowując, wraz ze wzrostem czasu trwania sesji roƛnie liczba spalonych kalorii, zarĂłwno pod względem wartoƛci minimalnych, ƛrednich, jak i maksymalnych. Jednoczeƛnie wzrasta zmiennoƛć wynikĂłw (odchylenie standardowe i IQR), co sugeruje, ĆŒe dƂuĆŒsze sesje treningowe prowadzą do bardziej zrĂłĆŒnicowanych rezultatĂłw w spalaniu kalorii. RozkƂad w kaĆŒdej kategorii jest lekko dodatnio skoƛny, z tendencją do większego spƂaszczenia w miarę wydƂuĆŒania sesji (kurtoza od -0,77 do -0,14).

Spalone kalorie a waga

Wykres przedstawia zaleĆŒnoƛć między wagą a liczbą spalonych kalorii. Punkty danych pokazują duĆŒÄ… zmiennoƛć w liczbie spalonych kalorii wƛrĂłd osĂłb o podobnej wadze, jednak trend zaznaczony linią regresji sugeruje niewielką dodatnią korelację. Oznacza to, ĆŒe osoby o wyĆŒszej wadze generalnie spalają więcej kalorii, choć zaleĆŒnoƛć ta jest sƂaba. Rozrzut punktĂłw wskazuje, ĆŒe na liczbę spalonych kalorii mogą wpƂywać takĆŒe inne czynniki, takie jak intensywnoƛć i rodzaj treningu.

Úrednia liczba spalonych kalorii dla rĂłĆŒnych typĂłw treningu

Wykres pokazuje, ĆŒe ƛrednia liczba spalonych kalorii jest zbliĆŒona dla wszystkich rodzajĂłw treningĂłw, przy czym HIIT i trening siƂowy spalają nieco więcej kalorii niĆŒ joga i cardio.

ƚrednie spalone kalorie wedƂug pƂci i poziomu doƛwiadczenia

Wykres przedstawia ƛrednią liczbę spalonych kalorii w zaleĆŒnoƛci od poziomu doƛwiadczenia i pƂci. Wraz ze wzrostem poziomu doƛwiadczenia (od 1 do 3) roƛnie ƛrednia liczba spalonych kalorii dla obu pƂci.

MÄ™ĆŒczyĆșni spalają nieco więcej kalorii niĆŒ kobiety na kaĆŒdym poziomie doƛwiadczenia, przy czym rĂłĆŒnica ta pozostaje niewielka. Na poziomie doƛwiadczenia 3 rĂłĆŒnica jest najbardziej widoczna, co moĆŒe wskazywać na większą intensywnoƛć lub efektywnoƛć treningu u bardziej doƛwiadczonych mÄ™ĆŒczyzn. OgĂłlnie trend pokazuje, ĆŒe większe doƛwiadczenie wiÄ…ĆŒe się z większą liczbą spalonych kalorii, niezaleĆŒnie od pƂci.

Úrednie tętno dla rĂłĆŒnych typĂłw treningu

Statystyki opisowe dla ƛredniego tętna w zaleĆŒnoƛci od typu treningu

Rodzaj treningu
Statystyka Yoga Cardio HIIT Trening siƂowy
Min 120 120 120 120
Max 169 169 169 169
Kwartyl dolny 132 130 131 132
Mediana 142 141 145.5 144
Kwartyl gĂłrny 156 155 157 158
Úrednia 143.33 143 144.44 144.24
Odch. std. 13.97 14.32 14.74 14.4
IQR 24 25 26 26
Odchylenie ćwiartkowe 12 12.5 13 13
Odch. std. w % 0.1 0.1 0.1 0.1
Odch. ćwiartkowe w % 0.17 0.18 0.18 0.18
Skoƛnoƛć 0.15 0.16 -0.03 0.06
Kurtoza -1.14 -1.18 -1.28 -1.22

Wyniki pokazują, ĆŒe ƛrednie tętno w rĂłĆŒnych rodzajach treningĂłw (joga, cardio, HIIT, trening siƂowy) jest bardzo zbliĆŒone. Úrednie wartoƛci oscylują wokóƂ 144 uderzeƄ na minutę, z minimalną i maksymalną wartoƛcią wynoszącą 120 i 169. Mediana jest najwyĆŒsza w jodze i treningu siƂowym (144), nieco niĆŒsza w HIIT (143) i cardio (142). Rozproszenie danych, mierzone odchyleniem standardowym, jest rĂłwnieĆŒ podobne, wynosząc okoƂo 14, co wskazuje na umiarkowaną zmiennoƛć w kaĆŒdej grupie.

Rozstęp międzykwartylowy (IQR) wynosi okoƂo 25 we wszystkich przypadkach, co potwierdza stabilnoƛć w centralnej częƛci rozkƂadu. RozkƂad danych jest niemal symetryczny (skoƛnoƛć bliska 0) i lekko spƂaszczony (kurtoza od -1.21 do -1.27), co oznacza mniejszą liczbę wartoƛci skrajnych w porównaniu do rozkƂadu normalnego. Ogólnie, wyniki wskazują na podobną intensywnoƛć treningową dla wszystkich analizowanych aktywnoƛci w kontekƛcie tętna.

ZaleĆŒnoƛć tętna spoczynkowego od wieku

Do wykresu wstawiono linię trendu wygƂadzoną, co pozwoliƂo uchwycić nieliniowe zaleĆŒnoƛci między zmiennymi. CieƄ to przedziaƂ ufnoƛci, ktĂłry wskazuje niepewnoƛć estymacji linii trendu. Szeroki cieƄ oznacza większą niepewnoƛć w przewidywaniu. Wykres przedstawia zaleĆŒnoƛć tętna spoczynkowego od wieku. Punkty na wykresie pokazują duĆŒÄ… zmiennoƛć indywidualnych wartoƛci, jednak trend zaznaczony linią regresji wskazuje, ĆŒe tętno spoczynkowe lekko spada do okoƂo 40. roku ĆŒycia, a następnie nieznacznie wzrasta. OgĂłlnie, tętno spoczynkowe utrzymuje się w stabilnym przedziale 60–70 BPM, niezaleĆŒnie od wieku, co sugeruje brak istotnych zmian w zaleĆŒnoƛci od wieku u większoƛci osĂłb.

Statystyki opisowe dla tętna spoczynkowego w zaleĆŒnoƛci od wieku

Wiek
Statystyka <30 lat 30-50 lat >50 lat
Min 50 50 50
Max 74 74 74
Kwartyl dolny 56 56 56
Mediana 62 63 62
Kwartyl gĂłrny 68 68.5 68
Úrednia 62.05 62.3 62.28
Odch. std. 7.34 7.3 7.38
IQR 12 12.5 12
Odchylenie ćwiartkowe 6 6.25 6
Odch. std. w % 0.12 0.12 0.12
Odch. ćwiartkowe w % 0.19 0.2 0.19
Skoƛnoƛć 0 -0.13 -0.04
Kurtoza -1.2 -1.16 -1.24

Wyniki pokazują, ĆŒe tętno spoczynkowe w zaleĆŒnoƛci od grupy wiekowej (<30 lat, 30-50 lat, >50 lat) jest stabilne, z niewielkimi rĂłĆŒnicami w ƛrednich wartoƛciach: 62,44 dla osĂłb mƂodszych, 62,1 dla grupy ƛredniej i 62,18 dla osĂłb starszych. Wartoƛci minimalne i maksymalne (50 i 74) są identyczne we wszystkich grupach, co wskazuje na spĂłjnoƛć w zakresie danych.

Mediana wynosi 62 lub 63, co sugeruje, ĆŒe tętno większoƛci osĂłb oscyluje w tym przedziale. Rozstęp międzykwartylowy (IQR) i odchylenie ćwiartkowe są zbliĆŒone (odpowiednio 12–13 i 6–6,5), co ƛwiadczy o porĂłwnywalnej zmiennoƛci w kaĆŒdej grupie wiekowej.

RozkƂad danych jest lekko ujemnie skoƛny (-0,06 do -0,1), co oznacza, ĆŒe wartoƛci niĆŒsze od ƛredniej są nieco częstsze, a kurtoza (od -1,2 do -1,23) sugeruje spƂaszczony rozkƂad, co wskazuje na mniejszą liczbę wartoƛci ekstremalnych. OgĂłlnie wyniki pokazują, ĆŒe wiek ma niewielki wpƂyw na tętno spoczynkowe.

Czas trwania sesji w zaleĆŒnoƛci od typu treningu

Wykres wiolinowy przedstawia rozkƂad czasu trwania sesji w zaleĆŒnoƛci od rodzaju treningu (joga, cardio, HIIT, trening siƂowy).

Największa zmiennoƛć czasu trwania widoczna jest w treningu siƂowym i HIIT, gdzie czas trwania sesji jest bardziej zrĂłĆŒnicowany, a wartoƛci rozkƂadają się szeroko w zakresie od okoƂo 0,5 do 2 godzin. Joga i cardio charakteryzują się bardziej skoncentrowanym czasem trwania sesji, ze szczytem w okolicach 1–1,5 godziny.

Úredni czas trwania treningu dla wszystkich rodzajĂłw treningĂłw oscyluje wokóƂ podobnych wartoƛci, jednak rozkƂady pokazują, ĆŒe joga i cardio mają mniej skrajnych wartoƛci w porĂłwnaniu do HIIT i treningu siƂowego.

Statystyki opisowe dla trwania sesji w zaleĆŒnoƛci od typu treningu

Typ treningu
Statystyka Yoga Cardio HIIT Trening siƂowy
Min 0.51 0.55 0.52 0.5
Max 1.99 1.99 2 1.99
Kwartyl dolny 1.03 1.085 1.0275 1.0525
Mediana 1.25 1.31 1.25 1.29
Kwartyl gĂłrny 1.42 1.485 1.4425 1.4775
Úrednia 1.22 1.3 1.24 1.27
Odch. std. 0.34 0.32 0.35 0.35
IQR 0.39 0.4 0.42 0.42
Odchylenie ćwiartkowe 0.19 0.2 0.21 0.21
Odch. std. w % 0.28 0.25 0.28 0.28
Odch. ćwiartkowe w % 0.31 0.31 0.33 0.33
Skoƛnoƛć -0.08 0.06 0.11 0.06
Kurtoza -0.36 -0.45 -0.26 -0.55

Wyniki pokazują, ĆŒe czas trwania sesji treningowych jest zbliĆŒony dla wszystkich typĂłw treningĂłw (joga, cardio, HIIT, trening siƂowy). Minimalny czas trwania wynosi okoƂo 0,5 godziny, a maksymalny blisko 2 godzin. Úredni czas trwania oscyluje między 1,23 godziny (cardio) a 1,28 godziny (joga i HIIT), co jest zbliĆŒone do median, ktĂłre rĂłwnieĆŒ wynoszą od 1,23 do 1,29 godziny.

Rozstęp międzykwartylowy (IQR) wynosi od 0,39 (cardio) do 0,42 (joga i HIIT), co wskazuje na podobny zakres w centralnej częƛci rozkƂadu. Odchylenie standardowe jest rĂłwnieĆŒ porĂłwnywalne (od 0,33 do 0,36), co ƛwiadczy o niewielkiej zmiennoƛci czasu trwania sesji w kaĆŒdej grupie. RozkƂad danych jest niemal symetryczny (skoƛnoƛć bliska 0), a kurtoza wskazuje na lekko spƂaszczony rozkƂad (od -0,55 do -0,25). OgĂłlnie, wyniki sugerują, ĆŒe wszystkie typy treningĂłw mają podobny czas trwania sesji, z niewielkimi rĂłĆŒnicami w zmiennoƛci i ksztaƂcie rozkƂadu.

Częstotliwoƛć treningów a czas trwania sesji

Wykres przedstawia zaleĆŒnoƛć między liczbą sesji treningowych w tygodniu a czasem trwania pojedynczej sesji, uwzględniając poziom doƛwiadczenia uczestnikĂłw.

Wraz ze wzrostem liczby sesji w tygodniu obserwuje się tendencję do wydƂuĆŒania czasu trwania pojedynczej sesji, co wskazuje na większe zaangaĆŒowanie w trening przy częstszej aktywnoƛci. Linia regresji podkreƛla dodatnią korelację między tymi zmiennymi.

Kolor punktĂłw, odpowiadający poziomowi doƛwiadczenia, wskazuje, ĆŒe osoby bardziej doƛwiadczone (jaƛniejsze punkty) częƛciej wykonują dƂuĆŒsze sesje i trenują więcej razy w tygodniu. Wynika z tego, ĆŒe zarĂłwno liczba sesji, jak i czas ich trwania rosną wraz z doƛwiadczeniem.

Procent tkanki tƂuszczowej ciaƂa a częstotliwoƛć treningów

PowyĆŒszy wykres obrazuje zaleĆŒnoƛci procentu tkanki tƂuszczowej od częstotliwoƛci treningĂłw. ZaleĆŒnoƛć jest odwrotnie proporcjonalna - im więcej treningĂłw, tym mniejsza tkanka tƂuszczowa dziaƂa.

Statystyki opisowe dla procentu tkanki tƂusczowej w zaleĆŒnoƛci od częstotliwoƛć treningĂłw

Częstotliwoƛć treningów
Statystyka 2 3 4 5
Min 20 20 10 10.1
Max 35 35 34.9 19.8
Kwartyl dolny 24.8 24.7 18.625 12.4
Mediana 27.4 27.6 25.3 14.5
Kwartyl gĂłrny 29.9 30.6 28.4 16.95
Úrednia 27.44 27.59 23.69 14.66
Odch. std. 3.85 3.93 6.68 2.89
IQR 5.1 5.9 9.77 4.55
Odchylenie ćwiartkowe 2.55 2.95 4.89 2.27
Odch. std. w % 0.44 0.46 0.5 0.79
Odch. ćwiartkowe w % 0.84 0.84 0.79 1.29
Skoƛnoƛć 0.06 -0.02 -0.39 0.12
Kurtoza -0.76 -0.87 -0.87 -1.19

Na podstawie uzyskanych wynikĂłw moĆŒna stwierdzić, ĆŒe wraz ze wzrostem częstotliwoƛci treningĂłw spada wartoƛć minimalna i maksymalna procentu tkanki tƂuszczowej. Mediana oraz ƛrednia wartoƛć jest zdecydowanie najmniejsza dla częstotliwoƛci treningĂłw wynoszącej 5 dni w tygodniu. Dla 5 dni najmniejsze są teĆŒ: odchylenie standardowe oraz wartoƛci kwartyli, co pokazuje, jak zostaƂy pogrupowane wartoƛci uzyskane dla tkanki tƂuszczowej. Wartoƛci skoƛnoƛci są bliskie zeru, co wskazuje lekką asymetrycznoƛć. Występuje zarĂłwno lewostronna (dla 3 i 4 dni w tygodniu), jak i prawostronna (2 i 5) asymetria.

ZaleĆŒnnoƛć BMI od wieku oraz typu treningu

Histogramy

Maksymalne tętno

ƚrednie tętno

Spoczynkowe tętno

Wnioskowanie

Podsumowanie